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Останнім часом серед найбільш актуальних напрямів у розробці інформаційного 
забезпечення виділився такий помітний сегмент ІТ-досліджень, як створення техно- 
логій шостого покоління, які в англомовній термінології мають абревіатуру МВІС 
(в українській термінології використовують абревіатуру НБІК-технології), відповідно 
до перших букв найменувань технологій: М або Н-- нано, В або Б -- біо, І - інфо, Сабо К - 
когно. Даний підхід має інтегрувати в собі риси та характеристики всіх вищенаведених 
технологій для побудови та аналізу об'ємної багатовимірної моделі інформаційних об'єк- 
тів. Побудована модель за допомогою багаторівневого представлення різної за походжен- 
ням та модальністю інформації про об'єкт виводить якість аналізу та інтелектуальної 
обробки текстів на суттєво вищий рівень з огляду на наявність різнопланових точок 
зору на інформаційні об'єкти вхідного тексту. 

Враховуючи, що останнім часом обсяги інформаційних потоків подвоюються 
менш ніж за 5 років (1), то стратегічно важливим є не стільки володіння інформацією, 
скільки вміння швидше за інших її обробити, систематизувати й отримати нові актуаль- 
ні знання. На вирішення цієї задачі зорієнтовані когнітивні технології, які, у свою 
чергу, можуть бути побудовані на основі формалізації когнітивних здібностей людини 
(лат. сорпійо - пізнання, пізнавання, пізнавальні функції). Когнітивні технології часто реа- 
лізуються через засоби масової інформації (ЗМІ), найбільш оперативним з яких є Інтер- 
нет. Залежно від спрямованості пошуку, потрібна інформація міститься як на сайтах 
новин, так і різноманітних соціальних мережах, форумах, блогах, інших площадках 
Інтернет-спілкування. Їх аудиторія становить мережне співтовариство та може бути 
як їх активним учасником, так і об'єктом їх застосування. 

Оскільки визначальним чинником у використанні когнітивних технологій є швид- 
кість опрацювання інформації з її подальшим оптимальним використанням, потрібно 
удосконалення технологій пошуку та опрацювання інформаційних повідомлень ЗМІ 
за допомогою програмних засобів автоматизованого моніторингу. Для цього доціль- 
ним є винайдення нових підходів та вдосконалення вже існуючих у лінгвістичному 
забезпеченні цих засобів, залежно від інформаційних потреб користувача (аналітика 
служби моніторингу). 

Тому метою і основним змістом статті є розробка нових принципів пошуку та від- 
бору інформації серед текстів когнітивних технологій у мережі Інтернет та нових підходів 
до формування лінгвістичного та програмного забезпечення системи автоматизова- 
ного моніторингу. 

При формуванні лінгвістичного забезпечення для пошуку зазначених текстів необ- 
хідно врахувати їх особливості: як лексичні, так і особливості мовних конструкцій. 
Важливою властивістю текстів когнітивних технологій, присутніх в Інтернет, є пере- 
давання інформації за допомогою частково неусвідомлюваного, направленого сигналу 
на вербальному чи невербальному рівнях -- так звана сугестія. Це форма міжособистісно- 
го та міжгрупового спілкування, яка відрізняється від переконання зниженим рівнем 
критичності та потреби у верифікації інформації. 

Застосування в Інтернет когнітивних технологій з елементами сугестії націлено 
на масовий результат. Їхнім об'єктом найчастіше виступає певне мережне співтоварист- 
во: соціальні мережі, форуми, блоги, інші площадки Інтернет-спілкування. 

Європейська дослідницька компанія Пл5еєСопяційтя.ей підрахувала, що різними 
соціальними мережами в усьому світі зараз користуються більш ніж 1 млрд людей (21. 
Останнім часом до соціальних мереж приєдналось більш ніж 7090 усіх Інтернет-користу- 
вачів. Хвиля «ІасебооК»-революцій дійсно продемонструвала здатність Інтернету грати 
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провідну роль серед ЗМІ, оскільки це наймасовіший, найдешевший та найважче конт- 
рольований державою засіб масової інформації. Події «Іасероок»-революцій, що відбулись 
у низці країн в останні роки, довели, що сугестивний вплив на мережні співтовариства 
може спонукати їх представників до дій у реальному світі. 

За дотримання сугестивності на мовному рівні відповідає сугестивна лінгвісти- 
ка - міждисциплінарна наука на стику філології та психології. Формою втілення су- 
гестивності у мові є дискурс. Він може бути вербальним 1 невербальним (жести, міміка 
тощо). Особливостями такого дискурсу в Інтернет-новинах та на сайтах соцмереж є: 

- конкретність та образність ключових слів у дискурсах офіційних і неофіційних 
Інтернет-ресурсів 1 посиланнях пошукових систем. В інтернетних посиланнях автори 
новин намагаються використати ключові слова, які навіть у випадку непрочитання са- 
мого тексту програмували б читача у потрібному напрямі; 

- емоційне перенасичення тексту: велика кількість яскравих прикметників, порів- 
нянь, метафор та інших образних засобів, що підмінюють фактичний матеріал; 

-- використання риторичних запитань, що підштовхують читача до потрібних від- 
повідей; 

- приховування джерел інформації (з посиланням на «деяких експертів» тощо); 

- вживання наказових конструкцій, що найбільш дієво для посттоталітарного 
співтовариства; 

- використання лінгвістичних структур єдності, довіри; 

-- експлуатація ідеї «кола своїх», навмисне включення до нього мережного ресурсу; 

- використання евфемізмів, що залучає підсвідомість споживача інформації та фор- 
мує необхідний маніпулятору образ; 

- активне звертання до антропоцентричних словотвірних моделей: уведення в текст 
новоутворень, що називають осіб; 

- представлення слова як фізичного тіла, яке може стискатись, розширюватись 
та зливатись з іншими словами; 

- візуальне підкріплення змісту переданої інформації також сприяє підвищенню 
сили навіювання (певним чином підібраними фотографіями, малюнками, смайлами 
тощо замінюють в Інтернет-комунікації міміку, жестикуляцію), оскільки немовні мо- 
менти спілкування менше піддаються осмисленому контролю: «ні з чого» виникає певне 
емоційне ставлення. 

З огляду на це формування бази знань системи автоматизованого моніторингу 
повинно враховувати як лексичні одиниці, так і мовні конструкції, властиві сугестивно- 
му дискурсу. Воно також повинно відображати загальні тенденції розвитку у сфері, якої 
стосуються повідомлення зазначеної специфіки. Цю базу слід періодично оновлювати 
та настроювати згідно з поточним інформаційним контентом. 

До бази знань даної системи слід включити такі складові: 

- визначений профіль пошуку (розділи новин в електронних ЗМІ, певні сайти, 
що є місцем спілкування Інтернет-спільнот); 

- тематику, визначену напрямом діяльності; 

- емоційну забарвленість текстів повідомлень; 

- мову повідомлення, визначену завданням пошуку. 

Одним із засобів, здатних встановити емоційну забарвленість тексту, є технологія 
Зепійтепі апаЇуз15, що дозволяє розподілити повідомлення за характером на позитив- 
ні та негативні згідно з оціночними судженнями їх авторів про предмет обговорення. 
Завдяки фільтрам на інформацію певного характеру, наприклад, негативну, є можли- 
вість відбирати тексти певної спрямованості згідно з завданнями пошуку. 
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При здійсненні моніторингу необхідно враховувати пошуковий профіль користу- 
вача (із врахуванням особливостей спектра його інтересів), а також те, щоб можна 
було задавати пошук не лише запитами, але й прикладами еталонних документів за їх 
«образом 1 подобою» за змістом і за семантикою. Новизна підходу полягає у тому, що до- 
кумент шукається не за принципом співпадіння ключових слів, а за принципом відпо- 
відності семантичних структур знайденого документа запиту користувача. Саме завдяки 
цьому вдається ефективно долати проблеми негативного впливу полісемії багатозначних 
слів та словосполучень на точність смислового аналізу текстів |3|. 

Також важливим є те, що пропонується запровадження алгоритмів семантичного 
пошуку, які допомагають поширювати інформаційно-пошукові запити за допомогою 
синонімів, семантично-близьких понять (термів), які містяться в семантичній базі знань 
системи |4). Це дасть змогу формалізувати процес складання ефективного пошукового 
запиту, побудувати синонімічний ряд для кожного зі слів та вкласти до пошукової 
системи усі необхідні дані. Таким чином можна знайти такий текст, який не містить 
жодного ключового слова з запиту і при цьому повністю за змістом та семантикою відпо- 
відає даному запиту. 

Для знаходження повідомлень за вказаним напрямом із текстом, що «підозрюється» 
на наявність ознак сугестивності, проводиться лінгвістичний аналіз, складовими якого 
є лексико-морфологічний, синтаксичний, семантичний аналіз для отримання певної 
семантичної структури, яку можна проаналізувати з точки зору впливу на цільову ауди- 
торію. Згідно з синтаксичною структурою текстів будуються семантичні графи та прово- 
диться психолінгвістичний аналіз їх компонентів. 

Повідомлення, якими обмінюються в Інтернет-спільноті, часто представлені 
у вигляді коротких текстів, (наприклад, «твітів»), які не піддаються стандартним алгорит- 
мам. Для відстеження даних повідомлень необхідно використання алгоритмів, спеціально 
пристосованих для обробки таких текстів. Тому з урахуванням нових особливостей 
Інтернет-контенту з'являється все більше спеціалізованих пошукових систем, які ви- 
користовують для пошуку на сайтах з конкретної тематики. Згідно з останніми науковими 
дослідженнями, для побудови бази знань для вирішення зазначених завдань доцільно 
використовувати як тексти довільної форми, так і напівструктуровані джерела інформа- 
ції (таблиці, списки, сайти регулярної структури). Також слід приділити увагу системам 
безперервного навчання, наприклад, такій, що реалізована у проекті МЕЇ І, |3| та ітерацій- 
но виконує дві задачі: задачу читання і задачу навчання. Під задачею читання розу- 
міється отримання системою нових фактів з неструктурованих або напівструктурованих 
джерел (текстів). Задача навчання - на отриманих фактах сформувати нові патерни 
для більш ефективного «читання» системою текстових масивів мережі Інтернет | 61. 

Автоматичний розподіл відібраних повідомлень доцільно здійснювати залежно 
від особливостей висвітлення у них об'єкта пошуку. Для цього у процесі семантичного 
аналізу повідомлень з елементами сугестивних технологій пропонується використан- 
ня підходів, що застосовуються у системах семантичного моніторингу |7). В даних 
системах використовуються контекстний асоціативно-семантичний аналіз для обробки 
текстових потоків 1 корпусів з блоком якісного оцінювання лінгвістичних фокусних 
об'єктів. Він дозволяє обчислювати якісні характеристики й параметри будь-якого за- 
даного лінгвістичного об'єкта в корпусах текстів і текстових потоках, відстежуючи 
динаміку змін та визначаючи основні тенденції оцінювання фокусного об'єкта. Після 
подачі на вхід системи імені заданого об'єкта, вона формує семантичний фокус-образ 
у мережі онтології, обчислюючи якісні характеристики і параметри заданого об'єкта 
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в тексті. Важливим етапом створення системи семантичного моніторингу є формування 
лінгвістичної шкали для якісних оціночних концептів онтології. Перший підхід визначен- 
ня чисельно-порядкових значень концептів виконується за допомогою асоціативно- 
контекстних алгоритмів, які шукають відстані в мережі онтології між поточним кон- 
цептом і концептом-максимумом (мінімумом) даної шкали. Другий підхід, задіяний при 
розробці лінгвістичної шкали, використовує частотні алгоритми, що визначають ча- 
стоту спільної появи пар слів у глобальних корпусах текстів, встановлюючи таким 
чином близькість їх семантичних значень (із врахуванням винятків серед сполучень 
певних груп слів). Такий контекстний асоціативно-семантичний аналіз дозволяє гнучко 
варіювати значення якісних оціночних концептів, залежно від локально-глобального 
контексту, що дає можливість враховувати складні з точки зору ординарної семантики 
випадки застосування лексики. 

Використання цього підходу забезпечує обчислення якісних характеристик 1 пара- 
метрів тексту з відстеженням динаміки змін та визначенням основних тенденцій оціню- 
вання об'єкта вивчення. 


Висновки 


Запровадження програмних засобів пошуку та відбору текстових повідомлень 
когнітивних технологій у мережі Інтернет передбачає розробку нових підходів до ство- 
рення лінгвістичного забезпечення. Важливою властивістю текстів когнітивних техно- 
логій є сугестія, що враховує інформаційні потреби користувачів, тому лінгвістичне 
забезпечення повинно включати особливості сугестивного дискурсу. Це як певні лексичні 
одиниці, так і мовні конструкції, які слід брати до уваги при формуванні бази знань 
системи автоматизованого моніторингу. Цю базу слід періодично оновлювати та на- 
строювати згідно з поточним інформаційним контентом. 

Отже, лінгвістичне забезпечення програмних засобів пошуку та відбору тексто- 
вих повідомлень когнітивних технологій повинно включати: 

- базу знань із врахуванням профілю пошуку, об'єктів пріоритетного вивчен- 
ня Інтернет-повідомлень та їх особливостей; 

- алгоритми як для обробки неструктурованих даних (звичайних текстів новин то- 
що), так і для напівструктурованих даних (таблиць, списків, сайтів регулярної струк- 
тури) та коротких повідомлень. 

Основні етапи обробки текстових повідомлень з елементами сугестії повинні вклю- 
чати: 

- формалізацію повідомлень за напрямами пошуку, що передбачає побудову семан- 
тичних графів згідно із синтаксичною структурою речень у текстах повідомлень та по- 
дальшим психолінгвістичним аналізом компонентів графу; 

- автоматичний розподіл повідомлень, відібраних з мережі Інтернет програмни- 
ми засобами, з урахуванням актуальності повідомлення та характеристик джерел, які їх 
поширюють, а також особливостей висвітлення об'єктів, що становлять інтерес. 

При здійсненні моніторингу слід враховувати пошуковий профіль користувача, 
особливості спектра його інтересів, можливість завдання пошуку не лише запитами, 
але й прикладами еталонних документів за їх «образом і подобою». Пошук документа 
доцільно проводити не за принципом простого співпадіння ключових слів, а за принци- 
пом відповідності семантичних структур знайденого документа запиту користувача. 
Запровадження алгоритмів семантичного аналізу дозволить поширювати інформаційно- 
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пошукові запити за допомогою синонімів, семантично-близьких понять (термів), які 
містяться в семантичній базі знань системи. Застосування підходів напряму Зепійтепі 
Апаїузіз |8| в системах моніторингу та пошуку текстів когнітивних технологій дає можли- 
вість врахування багатьох нюансів та деталей емоційного забарвлення текстових пові- 
домлень, що є дуже затребуваним з огляду на специфіку основних цілей даної системи. 
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ВЕ5СМЕ 


О.О. Макспепко, О.М. Макспепко-Варфісі 
ФДеуеіортепі ої Ііпецізтс 50/ї мате ог Аціотатей 5еагсі апа 
УеЇесіїоп ої Техі5 оп Меуу5 Кезоитгсез апа іп 5осіа! Меїууо мк 


ему арргоасрез іо 50Йууаге деуеіортегі, апа їп рагіїсціаг бе Ппеці5йіс соппропегпі, аге 


пеедед Бог 5еагсп апа 5еЇесіїоп ої (ехі плез5аєез ої 5ресіаї їуре а5 пемує 5іїе5 апа 50сіаї 
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пебуогк8. ТРебе Кехіє аге Ше рагі ої собпійує гесплоїодіє5, апа КБе 5абєезіоп 15 ап ітпрогапі 
еіетепі оїПет, ШФегебоге, Ше ппоціябс зиррогі 5роцій шпсогрогаїе тодеі8 (паї сопсегп Кеакиге8 
ої зиєсевцує дізсошг5е. ТРре птаїп еіетепіз ої пе Кпом/едсе Ба5е ог 50Йїуаге 5еагсП апа 
зеЇесбіоп ої їехіз йог пемує 51їе5 апа 50сіа пебмогкя аге: 

- Кпом'едє» Баєе, іакіпє іо ассошпі Фе ргобіе ої Фе 5еагсй, ргіогігу гезеагсі обіесів ої 
Паегпеї теззаєез апа Шеїг Кеагиге5; 

- аїбогійртя Бог Чака ргосез5іпе, Бої ппз5ігасіогед апа зеплі-5ігистигей, а5 усі аз бог 
5рогі птез5аєся ргосез5іпе. 

Тре паїп 5їаєез ої'ехі8 ргосез5іпе млії Ше еіетепіз ої 5зисревцоп 5поцій ісТиде: 

- Їоптайганоп ої'Пе розіє іп Бе зеагсі. дігесіопе, уурбісі іпсішде репеганоп ої зетапіїс 
єгарр5 ассогаїпе 10 Бе зупіасіїс 5ігисішге ої зепіепсе5 їп Бе плеззаєе, ЮЙомей бу 
рєусройпеиійс апаіузія ої'їБе старі сопаропегпів; 

- ашопабс фвітібибоп ої пез5аєєзя саріигедй їп ре Пиегпей у 50Ймуаге (акіпо, їпіо 
ассошпі (реїг асішайку апа (ре сфагасіегізіїс5 ої Шеїг 50цгсе5 апа Ксакигеє ої Ше обіесіє 
десгірбоп. 

Тре плопіїогіпє 5роцід сопзідег 5еагсп п5ег ргобіе Іеагиге8, Піє іпіегезі5 зресітит, їре 
абішу їо ргоуіде 5еагсії диегіеє пої опіу Бу Кеум/огаз соїпсідепсе, Бик аїзо Бу ехатрієе8 ої 
теїегепсе доситепіз. Роситепі 5еагсі 5Поцій Бе сагтісд оці пої опіу Бу їБе ргіпстріе ої 5ітріе 
таїхріпє ої Кеум/огая, Бик аі5о Бу ре ргіпсіріє ої плаїсріпє (Бе 5еплапіїс 5їгискиге5 ої Пе 
досштепі о Фе ип5ег'я дцегу. О5іпє зетапіїс апа/узія аЇ огійртя млі! ргоміде ап оррогіилтїу 0 
ехрапа дшегіеє мії зупопутя, зеплапіїсаПу-сіозе сопсерів (кепт5) сопіаїпед їп ре зеплапіїс- 
разед зузіетіз. Арріуїше іесрпідцеє ої 5епійтепі Апаіузіє їп плопігогілє апа 5еагспіпе ої 
собпійуєе їесппоЇорле8 їехів умій каке їпіо ассоипі їде плапу пиапсе8 апа деїаїіз об'їре еплоопа! 
тодаїсу об'ехі8 боті пемуз 8їе5 апа 5осіа! пегмогкз. 
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